首页> 外文OA文献 >Fast and accurate annotation of short texts with Wikipedia pages
【2h】

Fast and accurate annotation of short texts with Wikipedia pages

机译:使用维基百科页面快速准确地注释短文本

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We address the problem of cross-referencing text fragments with Wikipediapages, in a way that synonymy and polysemy issues are resolved accurately andefficiently. We take inspiration from a recent flow of work [Cucerzan 2007,Mihalcea and Csomai 2007, Milne and Witten 2008, Chakrabarti et al 2009], andextend their scenario from the annotation of long documents to the annotationof short texts, such as snippets of search-engine results, tweets, news, blogs,etc.. These short and poorly composed texts pose new challenges in terms ofefficiency and effectiveness of the annotation process, that we address bydesigning and engineering TAGME, the first system that performs an accurate andon-the-fly annotation of these short textual fragments. A large set ofexperiments shows that TAGME outperforms state-of-the-art algorithms when theyare adapted to work on short texts and it results fast and competitive on longtexts.
机译:我们解决了用Wikipediapages交叉引用文本片段的问题,从而可以准确有效地解决同义词和多义性问题。我们从最近的工作流程中汲取了灵感[Cucerzan 2007,Mihalcea and Csomai 2007,Milne and Witten 2008,Chakrabarti et al 2009],并将他们的情况从长文档的注释扩展到了短文本的注释,例如搜索片段。引擎结果,tweet,新闻,博客等。这些简短且编排较差的文本在注释过程的效率和有效性方面提出了新的挑战,我们将通过设计和制造TAGME(第一个执行准确且实时的系统)来解决这些挑战。这些简短的文字片段的注释。大量实验表明,当TAGME适用于短文本时,它们的性能优于最新算法,并且在长文本上具有快速而具有竞争力的结果。

著录项

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号